Des disparités régionales ?

Column

On observe une disparité au niveau des régions sur la valeur d’une ETP.

Column

Au niveau national, une ETP semble avoir une valeur différente selon le type d’administration.

Column

Or, on observe une différence sur la répartition des effectifs selon le type d’administration au sein des régions.

La parité dans la recherche

Column

années sur la période

13

Evolution de l’effectif en recherche

+ 28.8 %

Evolution des femmes employées

+ 33.4 %

Column

Evolution des effectifs par sexe au niveau national

Différentiel du pourcentage de femmes dans la recherche entre 2001 et 2013, au niveau régional

A propos

Ce dashboard vous est proposé par Laurine ALLARD, Mélanie DEMEURE et Loïc STRAFELLA de la spécialisation Sciences des données d’Agrocampus Ouest, promotion 2021.

Vous pourrez trouver les données d’origine sur data.gouv.fr.

Quelques définitions :

-EPIC et assimilés : Établissement public à caractère industriel et commercial. Sont ajoutés l’institut polaire français (IPEV) qui est un groupement d’intérêt public depuis 2011 et Bpifrance (ex-Oséo) qui est une société anonyme depuis 2013.
-EPST : Établissement public à caractère scientifique et technologique
-Enseignement supérieur : Le champ regroupe les universités et établissements d’enseignement supérieur sous contrat MENESR, les centres hospitaliers et les autres établissements d’enseignement supérieur.
-Autres administrations : Le champ comprend les ministères (y compris la Défense), les établissements à caractère administratif (EPA) ainsi que les institutions sans but lucratif (ISBL)

---
title: "La Recherche publique en France"
output: 
  flexdashboard::flex_dashboard:
    orientation: columns
    vertical_layout: fill
    theme: journal
    social: menu
    source_code: embed
---

```{r setup, include=FALSE}
library(flexdashboard)
library(tidyverse)
library(ggtext)
library(ggpubr)
library(sf)
library(plotly)
library(showtext)
library(ggthemes)
library(htmltools)
require(scales)

#IMPORTATION DU JEU DE DONNEES
rdFR <- read.csv("./rd-moyens-administrations.csv", sep = ";")

#AS FACTOR
for (i in 1:12){
  rdFR[,i] <- as.factor(rdFR[,i])
}

#Fond de carte France par region 2014
reg<-st_read(dsn="regions-20140306-100m-shp/regions-20140306-100m.shp")

reg$nom
#On enl?ve les DOM TOM
guadeloupe<-reg[11,]
guyane<-reg[12,]
lareunion<-reg[16,]
martinique<-reg[19,]
mayotte<-reg[20,]

reg<-reg[-c(11:12,16,19:20),]
```



Des disparités régionales ?
=======================================================================

Column
-----------------------------------------------------------------------

### On observe une disparité au niveau des régions sur la valeur d'une ETP.

```{r}
#Préparation du jeu de données pour 2013
dep_tot_2013<-
  rdFR %>%
  filter(annee==2013) %>%
  filter(indicateur=="Depense interieure de R&D")%>%
  group_by(code_region,region)%>%
  summarise(Depense_Total=sum(valeur))

eff_tot_2013<-
  rdFR %>%
  filter(annee==2001) %>%
  filter(indicateur=="Effectifs de R&D")%>%
  group_by(code_region,region)%>%
  summarise(Effectif_Total=sum(valeur))



dep_eff_tot_2013<-merge(x=dep_tot_2013,y=eff_tot_2013,by.x = "region",by.y = "region")

#IMPORTANT jeu de données final 2013
filter_dep_eff_tot_2013<-
  dep_eff_tot_2013%>%
  mutate(Depenses_par_ETP=Depense_Total/Effectif_Total*10^6) %>% 
  arrange(desc(Depenses_par_ETP))


#On merge les donnees et le fond de carte
merge_dep_eff_2013<-merge(x=reg,y=filter_dep_eff_tot_2013,by.x="code_insee",by.y="code_region.x",all.x=T)


#Cartographie des des dépenses intérieures en R&D tout type d'administration confondu en 2001
merge_dep_eff_2013%>%
  st_transform(crs=32631)%>%
  ggplot() +
  geom_sf(aes(fill = Depenses_par_ETP)) +
  scale_fill_gradient(low="#ffffff",high="#048B9A",trans="log") +
  labs(fill = "Dépenses \n(millions d'euros/ETP)")+
  theme(
    axis.text.x = element_blank(),
    axis.text.y = element_blank(),
    axis.ticks = element_blank())+
  labs(title = "Dépenses totales par ETP au niveau des régions en 2013",
       caption = "Source : data.gouv")



```


Column {data-width=500}
-----------------------------------------------------------------------
### Au niveau national, une ETP semble avoir une valeur différente selon le type d'administration.
```{r}
dep_tot<-
  rdFR %>%
  filter(annee==2013) %>%
  filter(code_indicateur=="dird")%>%
  filter(code_region!=7) %>% 
  group_by(type_d_administration) %>% 
  summarise(depense_admin=sum(valeur))

eff_tot<-
  rdFR %>%
  filter(annee==2001) %>%
  filter(code_indicateur=="pers")%>%
  filter(code_region!=7) %>% 
  group_by(type_d_administration) %>% 
  summarise(eff_admin=sum(valeur))

dep_eff_tot<-merge(x=dep_tot,y=eff_tot,by.x = "type_d_administration",by.y = "type_d_administration")

filter_dep_eff_tot_2013<-
  dep_eff_tot%>%
  mutate(dep_eff_admin=depense_admin/eff_admin*10^6) %>% 
  arrange(desc(dep_eff_admin))

filter_dep_eff_tot_2013$type_d_administration<-factor(filter_dep_eff_tot_2013$type_d_administration,levels=filter_dep_eff_tot_2013$type_d_administration[order(filter_dep_eff_tot_2013$dep_eff_admin,decreasing = FALSE)])

filter_dep_eff_tot_2013 %>% 
  ggplot()+
  scale_fill_manual(values=c("#CC6666", "#9999CC", "#66CC99", "#E69F00")) +
  geom_bar(aes(x=type_d_administration,y = dep_eff_admin, fill=type_d_administration),stat = "identity")+
  scale_x_discrete(name="")+
  scale_y_continuous(name="Dépenses par ETP (euros)",labels = scales::comma)+
  theme(axis.text.x = element_text(face="bold", 
                                   size=14, angle=45))+
  theme_minimal()+
  coord_flip()+
  theme(legend.position = "none")+
  labs(title = "Dépenses par ETP au niveau national, en 2013\n en fonction des administration",
       caption = "Source : data.gouv")
```

Column
-----------------------------------------------------------------------

### Or, on observe une différence sur la répartition des effectifs selon le type d'administration au sein des régions. 
```{r}
admin1 <-  rdFR %>%
  filter(code_indicateur=="pers") %>%
  filter(annee==2013) %>% 
  group_by(code_region,region,type_d_administration) %>% 
  summarise(eff_tot=sum(valeur)) %>% 
  group_by(region) %>% 
  mutate(percentage=eff_tot/sum(eff_tot)*100) 

admin1 <- admin1[-c(1:21,99:101),]
admin1$type_d_administration <- factor(admin1$type_d_administration, levels = c('Autres administrations','Enseignement superieur','EPST','EPIC et assimiles'))
  

admin1 %>% 
  ggplot(aes(x =region, y = percentage,fill=type_d_administration))+
  geom_bar(stat="identity")+
  # geom_col(aes(fill = type_d_administration), width = 0.7)+
  scale_fill_manual(values=c( "#E69F00","#66CC99","#9999CC","#CC6666"),name = "Type d'administration",breaks = rev(levels(admin1$type_d_administration))) +
  # scale_fill_discrete(name = "Type d'administration",breaks = rev(levels(admin1$type_d_administration)))+
  # scale_fill_hue()+
  labs(y="Pourcentage de l'effectif",x="Région")+
  scale_x_discrete(labels = c("Alsace",
                              "Aquitaine",
                              "Auvergne",
                              "Basse-Normandie",
                              "Bourgogne",
                              "Bretagne",
                              "Centre",
                              "Champagne-Ardenne",
                              "Corse",
                              "France-Comte",
                              "Haute-Normandie",
                              "Ile-de-France",
                              expression(bold("Langudoc-Roussillon")),
                              "Limousin",
                              "Lorraine",
                              expression(bold("Midi-Pyrenees")),
                              "Nord-Pas-de-Calais",
                              "Pays de la Loire",
                              "Picardie",
                              "Poitou-Charente",
                              "Provence-Alpes-Cote d'Azur",
                              "Rhone-Alpes")) +
  coord_flip()+
  theme_minimal()+
  theme(legend.position="bottom") +
  guides(fill=guide_legend(nrow=2,byrow=TRUE)) +
  labs(title="Répartition du type d'administration en 2013\nau sein des régions",
       caption = "Source : data.gouv")

```






La parité dans la recherche {data-orientation=rows}
=======================================================================

Column {data-width=500}
-----------------------------------------------------------------------


### années sur la période

```{r}

par3 <- rdFR %>%
  filter(code_indicateur=="pers") %>% 
  filter(sexe!="Non ventile") %>% 
  group_by(annee,sexe) %>% 
  summarise(personnel=sum(valeur))%>% 
  group_by(annee) %>% 
  mutate(percentage=personnel/sum(personnel)*100) %>% 
  pivot_wider(names_from = sexe, values_from = c(personnel,percentage))

valueBox(13, icon = "fa-hourglass-half",
         color="grey87")
```



### Evolution de l'effectif en recherche

```{r}
effectif_total2001 <- sum(par3[1,2],par3[1,3])
effectif_fem2001 <- sum(par3[1,2])


effectif_total2013 <- sum(par3[13,2],par3[13,3])
effectif_fem2013 <- sum(par3[13,2])

evoleff <- round(((effectif_total2013-effectif_total2001)/effectif_total2001*100),1)
evoleff_fem <- round(((effectif_fem2013-effectif_fem2001)/effectif_fem2001*100),1)
  
valueBox(paste("+",evoleff,"%"),
         icon = "fa-chart-line",
         color="grey87")
```

### Evolution des femmes employées

```{r}
valueBox(paste("+",evoleff_fem,"%"), icon = "fa-female",
         color="pink")
```


Column {data-width=500}
-----------------------------------------------------------------------

### Evolution des effectifs par sexe au niveau national

```{r}

par3 %>%
  plot_ly(x=~annee,y=~personnel_Femmes,
          type="scatter",mode="line",name="Effectifs féminins",line=list(color='#F436F7',dash='dashed')) %>%
  add_trace(x = ~annee, y = ~personnel_Hommes,name = 'Effectifs masculins', mode = 'line',line=list(color='#371DCC',dash='dashed')) %>%
    add_trace(x = ~annee, y = ~percentage_Femmes, name = "Pourcentage de femmes", yaxis = "y2",mode="line",line=list(color='#F291F2',dash='dash')) %>%
    add_trace(x = ~annee, y = ~percentage_Hommes, name = "Pourcentage d'hommes", yaxis = "y2",mode="line",line=list(color="#8376CF",dash='dash')) %>%

  layout(
    margin = list(l = 50, r = 50, b = 50, t = 50, pad = 4),
    legend = list(
      title=list(text='Légende'),
      orientation = 'h',
      y = -0.3),
    xaxis=list(
      title=list(text='Années')
    ),
    yaxis=list(
      title=list(text='Effectifs')
    ),
    yaxis2 = list(
      overlaying = "y",
      side = "right",
      title = list(text='Pourcentage',
                   y=-100),
      range=c(0,100)),
    xaxis = list(title="x"))



```




### Différentiel du pourcentage de femmes dans la recherche entre 2001 et 2013, au niveau régional
```{r}

#### ANNEE 1 ################ 
par1 <- rdFR %>%
  filter(code_indicateur=="pers") %>% 
  filter(sexe!="Non ventile") %>% 
  filter(annee==2001) %>% 
  group_by(code_region,region,annee,sexe) %>% 
  dplyr::summarise(personnel=sum(valeur)) %>% 
  group_by(region) %>% 
  mutate(percent_2001=personnel/sum(personnel)*100) %>% 
  filter(sexe=="Femmes")

par2 <- rdFR %>%
  filter(code_indicateur=="pers") %>% 
  filter(sexe!="Non ventile") %>% 
  filter(annee==2013) %>% 
  group_by(code_region,region,annee,sexe) %>% 
  dplyr::summarise(personnel=sum(valeur)) %>% 
  group_by(region) %>% 
  mutate(percent_2013=personnel/sum(personnel)*100) %>% 
  filter(sexe=="Femmes")

#On merge les donn?es et le fond de carte
par12<-merge(x=par1,y=par2,by.x="code_region",by.y="code_region",all.x=T)

par12 <- par12 %>% 
  mutate(diff_percent=round((percent_2013-percent_2001),2))

#On merge les donnees et le fond de carte
par_reg<-merge(x=reg,y=par12,by.x="code_insee",by.y="code_region",all.x=T)

gg_parreg <- par_reg %>%
  st_transform( crs = 32631 )%>% 
  ggplot()+
  geom_sf(aes(fill = as.numeric(diff_percent))) +
  scale_fill_gradient2(midpoint = 0, low = "#1D00AD", mid = "white",
                            high = "#F436F7")+
  theme(legend.position="bottom")+
  labs(fill = 'Différence de pourcentage')+
  theme(
    axis.text.x = element_blank(),
    axis.text.y = element_blank(),
    axis.ticks = element_blank())+
  theme(plot.title = element_text(hjust = 0.5,size=10))

gg_parreg


```


A propos
=======================================================================

Ce dashboard vous est proposé par Laurine ALLARD, Mélanie DEMEURE et Loïc STRAFELLA de la spécialisation Sciences des données d'[Agrocampus Ouest](https://www.agrocampus-ouest.fr/), promotion 2021.

Vous pourrez trouver les données d'origine sur [data.gouv.fr](https://www.data.gouv.fr/fr/datasets/les-moyens-consacres-a-la-r-d-les-administrations-par-type-d-organisme-mesr/).  




**Quelques définitions :**  


-*EPIC et assimilés *: Établissement public à caractère industriel et commercial. Sont ajoutés l’institut polaire français (IPEV) qui est un groupement d’intérêt public depuis 2011 et Bpifrance (ex-Oséo) qui est une société anonyme depuis 2013.  
-*EPST* :  Établissement public à caractère scientifique et technologique  
-*Enseignement supérieur* : Le champ regroupe les universités et établissements d’enseignement supérieur sous contrat MENESR, les centres hospitaliers et les autres établissements d’enseignement supérieur.  
-*Autres administrations *: Le  champ  comprend  les  ministères  (y  compris  la  Défense),  les  établissements  à  caractère  administratif  (EPA)  ainsi  que  les  institutions sans but lucratif (ISBL)